伪存储专家装X指南进阶版
这是一个看脸的时代,一个不会打扮的小姑娘,怎能奢望得到王子的爱?
适当的伪装可以让我们迅速与陌生人打成一片,快速融入陌生的圈子。
同样,存储领域亦如此。
对于初入这个领域的新人来说,怎样才能避免一张口就被人识破你是圈外人呢?
之前我曾针对存储新人写过一篇《伪存储专家装X指南》文章,但更多的讲的装X是方式方法,关于存储技术方面的内容很少。
今天,为了让大家能够更优雅的装X,我还是从技术角度教大家怎么去忽悠,尽量避免出入职场的尴尬。
▉怎么跟别人通俗易懂的解释什么是存储?
第一次见面,通俗易懂的给别人介绍存储的发展过程,无疑第一印象给别人留下的就是专业。那么怎么简单且通俗易懂的介绍存储呢?那就需要看下面:
什么是存储?这是很多初入存储领域新人问的最多的问题。
存储,简单可以理解为用来记录信息的设备。古时候的堆石记事、结绳记事可以算作做早期存储信息的方式,现代的U盘,电脑硬盘,手机存储空间,是我们日常接触的最多的存储设备。
这些用户相对都比较好理解,我们今天主要聊的是企业存储。
企业存储,并没有一个统一的定义,可以理解为为企业客户提供信息存储的产品、方案或服务。
相比于基础架构中的计算、网络,搞存储是一个危险系数非常高的职业。
为什么呢?
计算出问题通常是局部单机的问题,重启就能解决大多数问题。网络虽然影响整体业务运行,但并不会对影响到最底层数据。
存储可以说是IT基础架构的"底座",出现问题往往会影响到全局的业务,这也让存储很多时候成为背锅侠。
存储的门槛儿比较高,这是因为存储涉及的东西很多,硬件架构、操作系统、软件工程、存储算法理论、系统架构等等都会涉及到。
存储的研发并非一朝一夕能够解决,这也导致国内的厂商在服务器、网络方面已经可以有完全替代国外厂商的产品,但是在存储领域,依然是国外品牌的天下。
究其原因,就是存储是企业业务的红线,国内的存储产品很难在性能、稳定性上满足当前用户的需求。
这样一个复杂的领域,对于一个新人来说,很难通过短时间就能弥补知识上的差距。但是在聊天的时候,我们可以通过一些方法弥补在技术上的缺陷。
简单来说,就是打比喻。通过类比的方式来跟别人介绍存储产品和技术,既可以让别人通俗易通的了解你要讲的内容,也可以弥补自己技术上的短板。
比如,你可以将存储跟我们熟悉的运输卡车来对比。
存储设备就相当于我们运输的卡车,最初的时候,我们需要一个小卡车可能就满足需求了。但是随着业务的增加,可能需要升级成更大容量的卡车,这个时候就是我们存储领域常说的Scale up的扩展方式。
当已经没有更大容量的卡车的时候,我们可能就需要多辆卡车同时运行满足业务需求,这个就相当于Scale out的扩展方式。
▉怎么通俗的理解存储的"三高"
存储系统有三个追求:高性能、高可靠、高扩展,俗称存储“三高”。就像人们身体中的三高一样,这"三高"直接决定着企业业务的运转情况,哪一项出了问题都直接影响到业务运行。
“三高”既有区别也有联系,我们今天就来简单聊下怎么通俗的理解这三块内容。
首先是高性能方面,存储对性能的要求主要体现在高并发、低延迟等方面。我们常见的形容存储性能的指标有IOPS和延迟。
我们先看下IOPS,首先I/O是指单个读或写数据操作请求,IOPS(吐出量)代表在每秒内可以处理多少个I/O请求。
简单理解,大家都坐过地铁,当地铁停靠站的时候,上去一个人或下去一个人,我们就可以称为一个IO,每秒钟上下去的人的总和可以称为地铁的IOPS。
除了IOPS,延迟也是存储的一个非常重要的参数。如果没有相关延迟的说明,则IOPS指标毫无意义,因为延迟决定了各个I / O操作的响应能力。
用上下地铁的例子来比喻,延迟相当于人在停车后的反应时间,如果延迟为一分钟,那么可能还没有开始上下车,门已经关闭了。
IOPS和延迟跟很多因素都有关系,访问方式、队列深度、介质类型等方面都会影响到存储的相关性能,企业在看存储性能还需要综合来看,单看一个参数并没有太大的价值。
接下来我们来看下可靠性方面。
我们经常在某某存储产品的介绍的彩页方面写着能提供5个9的可用性,有的甚至更高。这个往往就是用来说明存储的可靠性的。
人们常提的5个9高可用,即99.999%可用性,折算下来每年宕机时间才仅有5.256分钟。但这些数据其实只是理论上的数值,但在实际过程中显然并不合理。
对于只看指标的人来说,不要相信!不要相信!永远不要相信!重要的事情说三遍。
实际系统中,存储的可靠性包括多个环节,我们常见的跟可靠性相关的技术有RAID技术,副本技术,RTO/RPO等等。
RAID技术主要在集群中用到,通过RAID技术,我们可以将多个磁盘组成一个巨大的磁盘组,通过多个磁盘的组合来提升整个磁盘系统的效能。
利用这项技术,可以将数据切割成多个区块,存储在各个硬盘上。当磁盘组中任意一个硬盘发生故障时,仍可读出数据。在数据重构时,可将数据经计算后重新置入新硬盘中。
在分布式处理、多数据中心容灾等互联网应用的场景下比传统RAID更合适,这是典型的采取空间换性能和可靠性的例子。
在灾备方案,RTO及RPO是最基本的标准。RTO (Recovery Time Objective,复原时间目标)是企业可容许服务中断的时间长度。比如说灾难发生后半天内便需要恢复,RTO值就是十二小时;
RPO (Recovery Point Objective,复原点目标)是指当服务恢复后,恢复得来的数据所对应时的间点。如果现时企业每天凌晨零时进行备份一次,当服务恢复后,系统内储存的只会是最近灾难发生前那个凌晨零时的资料。
尤其是中小企业,在资源紧拙的情况,应先好好了解对RTO及RPO的要求,然后再看看价钱,那就比较容易找到,适合企业的方案了。
高扩展性方面,目前的存储产品都开始注重横向扩展,大多数的中高端存储在横向扩展方面的能力都非常不错,而在纵向扩展方面,企业客户就需要格外注意,一般的中端存储在纵向扩展方面还是有一些限制的。
▉关于存储的一些时髦观点
除了要了解一些技术知识,我们还要了解一些重要的时髦的观点,当讨论存储的时候,我们把这种惊人的观点抛出去,并且说的头头是道,必将能够震住很多人。
1.云存储厂商成最大存储提供商?
这个观点是随着公有云厂商的发展开始被人们谈论起来的。IT Brand Pulse是一家咨询公司,他们看了AWS和微软的IaaS去年的营收数据,然后做了两个大胆的假设:
第一,假设存储营收占IaaS整体营收的15%。
第二,假设存储营收占IaaS整体营收的20%。
如下图,通过对比IDC全球企业存储市场营收报告,他们发现AWS、Azure的云存储的市场份额在未来一段时间后,营收将超过传统的存储厂商。
这是否意味着未来云存储厂商将成为最大的存储公司吗?
关注这个关键,就仁者见仁智者见智。一些人会直接认为云存储是趋势,未来肯定云厂商是最大的存储厂商。
另外一些人则认为,AWS更多的是提供的存储服务,就像共享汽车的营收不能算作汽车的营收一样。同时这云厂商底层的基础架构往往也是来自戴尔、HPE等厂商的服务器和存储产品,这些份额应该算在这些提供硬件的厂商里。
2.高端存储是否过时?
随着EMC被Dell收购,HP的拆分,越来越多的人开始唱衰高端存储。尤其是随着云计算、分布式存储、软件定义存储的发展,人们甚至来讨论高端存储的兴趣都没有了。
但并不认为高端存储就过时了。
软件定义、分布式存储是利用廉价白牌机或者标准的机架服务器,但这些软件定义存储或分布式存储,在扩展性、延迟、IOPS方面都有自己的极限,对于像金融或电信这样对性能、延迟等要求非常高的企业来说,根本是满足不了需求的。
对那些存储性能要求非常高的客户来说,高端存储依然是他们的"必需品"。
3.存储与云怎么结合?
据统计,到2021年全球将有超过90%的企业会选择多云的环境部署,多云之路已被广泛认可。
为了应对种种挑战,企业存储也需要紧跟多云的这个趋势,不仅需要支持现代的云原生应用,同时需要支持多云环境,有良好的扩展性、易用性、灵活部署、敏捷弹性等特性。
确保数据能够在合适的时间,存放在合适的地方,满足不同工作负载和不同服务级别的要求。存储与云的结合将决定未来存储厂商的成败。
4.存储的极致性能在哪?
对极致性能的追求,是企业存储永远不变的一个追求。
随着数据的不断增长,金融、电信、政府等领域对性能的需求也不断加大。如金融的高频交易、风控系统、运营商的计费系统和政府的应急指挥等系统都对性能提出了新的要求。
基于SAS闪存的全闪存阵列已经不能满足用户的需求,为了达到一致的低延迟、性能最大化,有效降低IO/$成本,企业存储必须能够支持NVMe技术的全闪存,以达到对应用的快速、实时响应。